MaisConhecer - Quando menos informação gera respostas melhores: novo estudo desafia paradigma da inteligência artificial multiagente

Quando menos informação gera respostas melhores: novo estudo desafia paradigma da inteligência artificial multiagente

Pesquisa internacional mostra que transmitir raciocínios parciais entre agentes de IA pode aumentar a precisão em até 22 pontos percentuais e reduzir drasticamente o tempo de processamento

Imagem: Reprodução

Uma das premissas mais difundidas na ciência da computação sustenta que sistemas de inteligência artificial tomam decisões melhores quando recebem mais informações. Um novo estudo internacional, entretanto, sugere exatamente o contrário. Pesquisadores da Hong Kong University of Science and Technology (Guangzhou), da Hong Kong University of Science and Technology, da Zhejiang University e do Alibaba Group desenvolveram uma arquitetura de comunicação para sistemas multiagentes de IA que não apenas acelera o raciocínio, mas também melhora sua qualidade ao limitar estrategicamente a quantidade de informação recebida pelos agentes subsequentes.

O trabalho, intitulado “Streaming Communication in Multi-Agent Reasoning”, foi liderado por Zhen Yang, Xander Xu e Ying-Cong Chen, e apresenta o sistema STREAMMA, uma nova abordagem para coordenação entre múltiplos agentes de linguagem baseados em grandes modelos de IA.

Segundo os autores, os sistemas atuais operam sob uma lógica denominada “generate-then-transfer” — gerar e depois transferir. Nela, cada agente precisa concluir completamente seu raciocínio antes de enviá-lo ao próximo participante da cadeia. Esse mecanismo cria gargalos e faz com que a latência aumente proporcionalmente ao número de etapas do processo.

A proposta do STREAMMA é radicalmente diferente. Em vez de esperar a conclusão do raciocínio completo, cada agente transmite seus passos de pensamento assim que eles são produzidos. O próximo agente começa a trabalhar imediatamente, em um modelo semelhante às linhas de montagem industriais ou aos sistemas de processamento em pipeline utilizados em supercomputadores.

Mas o resultado mais surpreendente não foi o ganho de velocidade.

“Descobrimos que o streaming melhora simultaneamente a eficiência e a eficácia do raciocínio”, afirmam os pesquisadores no artigo. A explicação reside em uma característica pouco explorada dos grandes modelos de linguagem: a qualidade do raciocínio tende a ser mais alta nas etapas iniciais e a se deteriorar conforme a cadeia lógica se prolonga.

Em outras palavras, quando um agente downstream recebe apenas os primeiros passos — geralmente mais confiáveis — ele constrói sua própria linha de raciocínio antes que os passos posteriores, mais suscetíveis a erros, possam influenciá-lo negativamente.

Para validar a hipótese, a equipe conduziu testes em oito benchmarks de referência envolvendo matemática avançada, ciência e programação. Foram utilizados dois dos modelos mais avançados disponíveis atualmente: Claude Opus 4.6 e GPT-5.4. O STREAMMA foi comparado tanto com sistemas multiagentes convencionais quanto com agentes únicos.

Os resultados impressionam. Em média, o novo método superou os sistemas convencionais em 7,3 pontos percentuais utilizando Claude Opus 4.6 e em 1,5 ponto percentual utilizando GPT-5.4. Em alguns cenários específicos, como o benchmark HMMT 2026 de matemática competitiva, o ganho chegou a 22,4 pontos percentuais.

No caso do Claude Opus 4.6, a precisão média saltou de 73,5% para 81,7% em topologias de cadeia. Em determinadas configurações de grafo, a taxa chegou a superar 83%.

Além do ganho em precisão, os autores demonstraram avanços substanciais em velocidade. A análise teórica do estudo prevê que o sistema pode alcançar acelerações próximas ao limite matemático do paralelismo. Em experimentos reais, a arquitetura atingiu um aumento de desempenho de 26,9 vezes em relação à execução serial tradicional, correspondendo a cerca de 83% do limite teórico calculado pelos pesquisadores.

Outro resultado relevante foi a descoberta de uma nova lei de escalabilidade, denominada pelos autores de “step-level scaling law”. Até agora, a literatura em sistemas multiagentes concentrava-se principalmente no aumento do número de agentes. O estudo demonstra que aumentar o número de etapas de raciocínio por agente também produz ganhos consistentes de desempenho, criando uma nova dimensão de escalabilidade complementar ao crescimento da equipe de agentes.

Em um dos experimentos mais reveladores, os pesquisadores ampliaram simultaneamente o número de agentes e o número de passos de raciocínio. A precisão cresceu de 58,3% para 73,5%, enquanto a velocidade continuou aumentando significativamente.

O estudo também apresenta uma formulação matemática inédita para explicar quando sistemas de streaming, sistemas seriais ou agentes individuais são mais adequados. Os autores demonstram que o método STREAMMA é particularmente vantajoso quando as etapas iniciais do raciocínio são mais confiáveis do que as etapas finais — um padrão observado frequentemente em modelos de linguagem contemporâneos.

Os resultados possuem implicações importantes para o futuro da inteligência artificial. Sistemas multiagentes estão sendo cada vez mais utilizados em desenvolvimento de software, pesquisa científica, planejamento estratégico e resolução de problemas complexos. Melhorar simultaneamente velocidade, custo e qualidade do raciocínio representa um avanço significativo para aplicações industriais e científicas.

Os próprios autores reconhecem limitações. A técnica funciona melhor em tarefas que podem ser naturalmente decompostas em etapas de raciocínio, como matemática, programação e problemas científicos. Aplicações criativas ou classificações simples podem não se beneficiar da mesma forma. Além disso, o protocolo não é universalmente superior: seu desempenho depende do perfil de qualidade das etapas produzidas pelo modelo.

Ainda assim, o trabalho sugere uma mudança conceitual profunda na forma como pesquisadores entendem a colaboração entre inteligências artificiais. Em vez de presumir que mais contexto sempre produz melhores decisões, o estudo indica que o momento em que a informação chega pode ser tão importante quanto a quantidade de informação disponível.

“Quando o contexto chega importa mais do que quanto contexto chega”, concluem os autores. A frase resume uma descoberta que pode influenciar a próxima geração de arquiteturas de inteligência artificial distribuída.

Referência

Comunicação em fluxo contínuo no raciocínio multiagente. Zhen Yang , Xiaogang Xu , Wen Wang , Cong Chen , Xander Xu , Ying-Cong Chen

https://doi.org/10.48550/arXiv.2606.05158

Tecnologia Científica